STATISTIQUE
Cours

1. Intervalle de fluctuation (de pari) d'une moyenne

Cas des grands échantillons

Si l'on extrait d'une population parfaitement définie (µ et σ connus) des échantillons suffisamment grands ( en pratique n>30), nous avons vu que la distribution des moyennes m des échantillons suivait une loi Normale de paramètres (µ , ). La variable centrée réduite correspondante, , exprimant l'écart réduit entre les moyennes des échantillons et la moyenne de la population, suit alors une loi Normale centrée réduite de paramètres (0,1). Cette distribution théorique nous indique que 95 % des valeurs moyennes des échantillons appartiennent à l'intervalle Ip= . Avant de tirer au sort un échantillon représentatif de la population, nous pouvons donc parier avec une probabilité de 95 % de chance de gagner que la moyenne de cet échantillon appartiendra à cet intervalle. Cet intervalle est appelé intervalle de fluctuation ou intervalle de pari donné au risque 5 % (ce risque appelé risque  ou risque de première espèce est le risque de perdre le pari du fait des fluctuations d'échantillonnage). D'une manière générale, ce risque est fixé par le statisticien et détermine l'incertitude absolue ou la précision du pari  (i= ). Ainsi, prendre un risque élevé revient à diminuer l'étendue de l'intervalle de fluctuation. Ne prendre aucun risque reviendrait à proposer un intervalle d'étendue infinie. Classiquement, la valeur du risque utilisé est de 5 %, valeur arbitraire mais mieux perçue médiatiquement ou psychologiquement qu'une valeur telle que 3 ou 7 % ! . D'autre part, cette valeur standard de 5 % permet de comparer facilement des analyses statistiques différentes. Enfin la valeur de ε 0,05 (1,96) correspondant à ce risque peut être arrondie à 2, ce qui simplifie l'expression de l'incertitude absolue exprimée à ± 2 écarts types.

Si après avoir défini un intervalle de fluctuation des moyennes au risque 5 % par exemple et pour des échantillons de n individus, on extrait à l'aide d'un plan d'échantillonnage donné un échantillon de n individus, nous pouvons alors déterminer la moyenne de cet échantillon.

Il se peut que la valeur mesurée appartienne où n'appartienne pas à l'intervalle de fluctuation défini préalablement. Comment interpréter ce fait ? C'est à ce niveau qu'intervient la prudence et la subtilité du jugement statistique.

Si la moyenne mesurée est en dehors des limites fixées, on peut conclure que ceci s'explique par les fluctuations d'échantillonnage et que l'on n'a pas eu de chance lors de l'extraction de l'échantillon ; on avait en fait 5% de chance (de risque) d'obtenir un tel échantillon. Mais l'analyse ne s'arrête pas là. Est-on certain d'avoir extrait un échantillon représentatif de la population? Si c'est le cas, en répétant l'expérience un grand nombre de fois (100 fois par exemple), on devrait trouver 5 échantillons en dehors des limites fixées par l'intervalle de pari. Si au contraire, on trouve beaucoup plus d'échantillons hors limites, c'est le signe que les échantillons n'ont pas été extraits dans de bonnes conditions (on parle alors d'échantillons biaisés). Or ce risque n'est pas défini au départ, car le biais introduit dans le plan d'échantillonnage n'a pas été établi.

Si l'échantillon prélevé entre dans les limites fixées par l'intervalle de fluctuation, ceci n'exclut pas pour autant que l'on soit en présence d'un échantillon biaisé car le hasard peut faire en sorte que l'échantillon soit biaisé mais donne une moyenne entrant dans les limites de l'intervalle de pari. Ce risque, difficile à quantifier est appelé risque β ou risque de deuxième espèce et doit toujours être gardé en mémoire quand on réalise une expérience. Nous reviendrons plus en détail sur ces interprétations lors des tests statistiques d'hypothèse.

Cas des petits échantillons (n<30)

La démarche est la même que précédemment ; la loi Normale décrit la distribution des moyennes des échantillons mais il est nécessaire de s'assurer que la distribution de la variable quantitative étudiée dans la population suive une loi Normale. On peut répondre à cette question en réalisant un test de normalité (droite de Henri par exemple).

Cas particulier de l'intervalle de pari pour un individu

On peut parier sur la valeur prise par le caractère quantitatif pour un individu extrait de la population et donner un intervalle de fluctuation pour cet individu. On se ramène alors à la distribution du caractère quantitatif dans la population ; on doit alors connaître ou démontrer la loi de distribution (généralement la Normalité) que suit la variable aléatoire dans la population. Dans ces conditions, l'intervalle de pari est calculé de la façon suivante :

Ce type d'intervalle est souvent utilisé pour définir les normes concernant les constantes biologiques d'une population donnée (taux de glucose, cholestérol...). Cet intervalle est bien sûr plus large que l'intervalle de fluctuation d'une moyenne. On notera qu'une valeur extérieure à cet intervalle, ne laisse pas forcément conclure que le sujet est malade ; Pour un risque 5 %, 5% des sujets normaux peuvent présenter des valeurs extérieures à l'intervalle fixé. On préférera cependant ordonner des examens complémentaires car le risque de maladie (dont on ignore la probabilité) est bien présent.

AccueilImprimerRéalisé avec SCENARIIntroduction (page Précédente)2. Intervalle de fluctuation ( de pari) d'un pourcentage (page suivante)